ImageNet 每年都會舉辦ILSVRC競賽,經過近八年的比賽過程,產生了不少厲害的CNN模型架構,Keras就把他們收率進框架哩,叫做Keras Application。
VGG最重要的概念就是大量使用3X3的捲積層、較小的stride (strides=1)以及Pooling (2X2),論文作者認為較小的捲積層可以提高所得到的資訊量。此外,相對於Alexnet所使用的7X7捲積層,3X3的捲積層也有較高的非線性能力。此外,VGG也證明了深度越深越好!透過較小的filter所疊出來的架構仍然能繼續提高。
VCG主要貢獻是使用更多的隱藏層,大量的圖片訓練,提高準確率至90%。VGG16/VGG19分別為16層(13個卷積層及3個全連接層)與19層(16個卷積層及3個全連接層),
大家如果有興趣想知道VCG16&VCG19如何實做出來可以參考https://github.com/mc6666/MyNeuralNetwork,由於我還只是一個初學者,我乍看那程式碼只知道因為很多層,導致參數量很多,但實際上的整體規劃我還是要再努力。
參考
https://ithelp.ithome.com.tw/articles/10192162
https://ithelp.ithome.com.tw/articles/10222575